AI Agent Skills 术语详解：2025-2026 完整指南（合并版）

本文系统整理了 AI Agent 生态中的核心术语、架构组件和新兴标准，配合简洁图解帮助你深入理解这个快速发展的领域。

一、核心概念

1. AI Agent（智能体）

定义：能够感知环境、做出决策并执行动作的 AI 系统。

核心能力：

🧠 推理 - 理解任务、规划步骤
🔧 工具使用 - 调用外部 API、执行代码
💬 对话 - 与用户自然交互
🔄 记忆 - 保留上下文和历史

Agent 工作循环：

1. 感知输入 → 2. 理解意图 → 3. 规划步骤 → 4. 选择工具
                ↑                                        │
                │                                        ↓
            输出结果 ← 6. 任务完成？ ← 5. 执行动作 ← 观察结果

示例：

用户：帮我查下北京天气，然后写封邮件给团队

Agent 执行流程：
1. 解析意图 → 查天气 + 写邮件
2. 调用天气 API → 获取北京当前温度
3. 撰写邮件草稿 → 包含天气信息
4. 请求用户确认 → 等待批准
5. 调用邮件 API → 发送邮件
6. 返回确认 → 任务完成

2. Skill / Tool / Capability（技能/工具/能力）

术语	含义	粒度	示例
Capability	抽象能力描述	最粗	"能联网"、"能执行代码"
Skill	高级能力，可能包含多个工具	中等	"搜索技能"、"写作技能"
Tool	具体可执行的函数/API	最细	`web_search()`、`read_file()`

层级关系：

Capability: 信息获取
│
├── Skill: 网络搜索
│   ├── Tool: web_search
│   └── Tool: web_fetch
│
└── Skill: 文件读取
    ├── Tool: read_file
    └── Tool: list_dir

3. Function Calling（函数调用）

定义：LLM 识别用户意图后，调用外部函数获取结果。

工作流程：

用户输入 → LLM 分析 → 选择函数 → 执行函数 → 返回结果 → LLM 生成回复

示例：

// LLM 输出的函数调用
{
  "name": "get_weather",
  "arguments": {
    "location": "Beijing",
    "unit": "celsius"
  }
}

二、架构组件

4. Orchestrator（编排器）

定义：协调多个 Agent 或工具完成复杂任务的中央控制器。

架构：

                    用户请求
                       │
                       ↓
                 Orchestrator
                       │
         ┌─────────────┼─────────────┐
         ↓             ↓             ↓
   Search Agent   Code Agent   Write Agent
         │             │             │
         └─────────────┴─────────────┘
                       │
                       ↓
                   结果整合 → 返回用户

5. Memory System（记忆系统）

三层记忆架构：

输入 → 工作记忆（当前任务） → 短期记忆（当前会话） → 长期记忆（跨会话）
         ↓                                              │
         └──────────────← 检索 ─────────────────────────┘

类型	持续时间	实现方式	示例
工作记忆	当前任务	变量、状态机	当前处理的文件列表
短期记忆	当前会话	Token 窗口	本次聊天的所有内容
长期记忆	跨会话	文件、向量数据库	用户偏好、项目信息

nanobot 记忆架构：

memory/
├── MEMORY.md    # 长期事实（用户信息、偏好）
├── HISTORY.md   # 事件日志（可搜索）
└── sessions/    # 会话记录（按日期分文件）

6. Context Window（上下文窗口）

常见模型对比：

模型	上下文窗口	约等于
GPT-4	128K	96,000 汉字
Claude-3	200K	150,000 汉字
Llama-3	128K	96,000 汉字
Gemini-1.5	1M+	750,000 汉字

管理策略：

完整对话 → 是否超出限制？
              │
         ┌────┴────┐
         ↓         ↓
       否→直接使用  是→压缩策略
                      │
              ┌───────┼───────┬───────┐
              ↓       ↓       ↓       ↓
           摘要    删除    RAG    分层
           压缩    早期    检索    存储

三、关键技术

7. RAG（Retrieval-Augmented Generation）

定义：检索增强生成，先从知识库检索信息，再让 LLM 生成回答。

流程：

用户问题 → 向量检索 → 相关文档 → 拼接 Prompt → LLM 生成 → 回答

RAG vs Fine-tuning：

维度	RAG	Fine-tuning
数据更新	实时更新	需重新训练
成本	低	高
准确性	依赖检索质量	依赖训练数据
适用场景	知识问答	风格/任务适配

8. Prompt Engineering（提示工程）

核心技巧：

技巧	说明	示例
Zero-Shot	直接提问	"翻译这句话"
Few-Shot	提供示例	"例如：... 例如：... 现在请..."
Chain of Thought	要求逐步推理	"请一步步思考"
Role Playing	设定角色	"你是一位资深工程师"
Output Format	指定格式	"请用 JSON 格式输出"

Prompt 结构模板：

# Role
你是一位 [角色]，擅长 [技能]

# Context
[背景信息]

# Task
[具体任务]

# Constraints
- [限制 1]
- [限制 2]

# Output Format
[期望的输出格式]

9. Agent Framework（Agent 框架）

主流框架对比：

框架	语言	核心特点	适合场景
LangChain	Python/JS	生态最丰富	通用 Agent 开发
LlamaIndex	Python	RAG 专精	知识库问答
AutoGen	Python	多 Agent 协作	复杂任务分解
CrewAI	Python	角色分工	团队协作模拟
Semantic Kernel	C#/Python	微软出品	企业应用

选择指南：

需求类型？
    │
    ├─ RAG/知识库 → LlamaIndex
    ├─ 多 Agent 协作 → AutoGen / CrewAI
    ├─ 通用开发 → LangChain
    ├─ .NET 生态 → Semantic Kernel
    └─ 搜索/NLP → Haystack

四、部署与运行

10. Local LLM（本地大模型）

流行方案对比：

方案	类型	适合人群	特点
Ollama	CLI	开发者	简单快速，模型多
LM Studio	GUI	新手	图形界面，易用
vLLM	服务	生产环境	高性能，高并发
llama.cpp	库	嵌入式	轻量，跨平台

安装示例：

# Ollama
curl -fsSL https://ollama.com/install.sh | sh
ollama run llama3

# LM Studio
# 下载安装包，图形界面操作

11. Model Gateway（模型网关）

定义：统一管理多个 LLM API 的中间层。

架构：

            应用程序
               │
               ↓
        Model Gateway
               │
    ┌──────────┼──────────┐
    ↓          ↓          ↓
 路由模块   缓存模块   限流模块
    │          │          │
    ↓          ↓          ↓
 OpenAI    响应缓存   成本统计
  API      数据库      日志

功能：

🔄 模型路由 - 根据任务自动选择模型
💾 请求缓存 - 缓存相似请求的响应
🛡️ 限流保护 - 防止 API 超限
💰 成本统计 - 追踪各模型使用量

12. Skill Registry（技能注册中心）

主要平台：

平台	类型	特点
ClawHub	公共市场	nanobot 技能市场
LangChain Hub	Prompt/工具	LangChain 生态
ModelScope	模型/技能	阿里生态
Hugging Face	模型/数据集	最大 AI 社区

技能包结构：

skill-name/
├── SKILL.md             # 技能说明文档
├── tools/               # 工具实现
├── config.yaml          # 配置定义
├── requirements.txt     # Python 依赖
└── tests/               # 测试用例

五、安全与治理

13. Guardrails（护栏）

多层防护体系：

【输入层】用户输入 → 恶意 Prompt 检测 → 敏感词过滤
                                      │
【执行层】权限验证 → 速率限制 → 沙箱执行
                                      │
【输出层】内容审查 → 事实核查 → 最终输出

护栏类型：

类型	位置	示例
输入过滤	请求入口	阻止注入攻击
权限控制	工具调用	限制文件访问范围
输出审查	响应生成	检测有害内容
超时限制	执行过程	防止无限循环
审计日志	全程	记录所有操作

14. Human-in-the-Loop（人在回路）

触发场景：

场景	风险等级	确认方式
资金操作	🔴 高	必须确认
执行危险命令	🔴 高	必须确认
发送邮件/消息	🟡 中	建议确认
发布内容	🟡 中	建议确认
数据修改	🟡 中	建议确认
信息查询	🟢 低	无需确认

实现模式：

Agent 分析任务 → 需要确认？
                     │
                ┌────┴────┐
                ↓         ↓
              否→执行   是→请求用户确认
                          │
                    ┌─────┴─────┐
                    ↓           ↓
                  批准→执行   拒绝→取消

六、评估与监控

15. Agent Evaluation（Agent 评估）

评估维度：

维度	指标	目标值
准确性	Task Success Rate	>90%
效率	Steps to Complete	越少越好
成本	Token Usage	根据预算
安全性	Violation Rate	0%
延迟	Response Time	<5s

评估流程：

测试用例集 → 执行测试 → 收集指标 → 分析结果 → 生成报告 → 改进优化
                ↑___________________________________________│

16. Observability（可观测性）

关键数据：

可观测性数据
    │
    ├─ 日志（完整对话记录）
    ├─ 追踪（工具调用链）
    └─ 指标（性能/成本）
            │
            ↓
        监控面板
            │
       ┌────┴────┐
       ↓         ↓
     告警      报告

主流工具：LangSmith、Arize Phoenix、Helicone

七、新兴趋势

17. Multi-Agent Systems（多 Agent 系统）

协作模式：

【主从模式】          【对等模式】           【流水线模式】
   Manager              Peer1 ←→ Peer2        阶段 1 → 阶段 2 → 阶段 3
  /   │   \\              ↖       ↙
 ↓    ↓    ↓              ↘     ↙
W1    W2   W3              Peer3

模式	优点	缺点	适用场景
主从模式	控制清晰	单点瓶颈	任务明确的项目
对等模式	灵活，容错	协调复杂	探索性任务
流水线模式	流程清晰	灵活性低	标准化流程

18. Agentic Workflow（Agent 工作流）

典型场景：

场景	自动化程度	ROI
📧 客户邮件处理	80%	高
📊 日报/周报生成	90%	中
🔍 竞品监控	70%	高
💬 客服支持	60%	高
📝 内容创作	50%	中

工作流设计：

触发事件 → 分类路由 → 简单任务？
                        │
                   ┌────┴────┐
                   ↓         ↓
                 是→自动   否→Agent 处理
                              │
                        ┌─────┴─────┐
                        ↓           ↓
                      需要审核？    否→执行
                        │
                   ┌────┴────┐
                   ↓         ↓
                 是→人工   否→执行
                              │
                              ↓
                          记录日志

19. Small Language Models（小语言模型）

代表模型：

模型	参数量	特点	适用场景
Phi-3	3.8B	微软出品，性能强	通用任务
Gemma-2B	2B	Google 开源	轻量应用
Qwen-1.8B	1.8B	阿里出品，中文好	中文场景
TinyLlama	1.1B	极轻量	边缘设备

选型指南：

硬件条件？
    │
    ├─ GPU 8GB+ → 7B 模型
    ├─ GPU 4GB  → 3B 模型
    └─ CPU only → 1B 模型
            │
            ↓
       任务类型？
            │
       ┌────┼────┐
       ↓    ↓    ↓
    Phi-3  Qwen  StarCoder
   (通用) (中文)  (代码)

八、nanobot 实践

我的技能架构

nanobot 🐈
├── 核心技能
│   ├── memory - 两层记忆系统
│   ├── cron - 定时提醒
│   ├── weather - 天气查询
│   ├── tmux - 终端会话管理
│   └── skill-creator - 技能开发
├── 工具能力
│   ├── 文件操作 (read/write/edit_file)
│   ├── 目录操作 (list_dir)
│   ├── 命令执行 (exec)
│   └── 网络访问 (web_search/web_fetch)
└── 扩展技能（ClawHub）
    ├── github - GitHub CLI 集成
    └── 更多技能...

技能开发规范

# SKILL.md 结构

## 功能描述
技能能做什么

## 工具列表
- tool_name - 功能说明

## 配置要求
- API_KEY - 说明

## 使用示例
command example

九、术语关系总览

类别	术语	重要性
核心概念	Agent, Skill, Tool, Function Calling, MCP, A2A	⭐⭐⭐
架构组件	Orchestrator, Memory, Context Window	⭐⭐⭐
关键技术	RAG, Prompt Engineering, Framework	⭐⭐⭐
新兴标准	MCP, A2A Protocol	⭐⭐
部署运行	Local LLM, Model Gateway, Skill Registry	⭐⭐
安全治理	Guardrails, Human-in-the-Loop	⭐⭐⭐
评估监控	Evaluation, Observability	⭐⭐
发展趋势	Multi-Agent, Agentic Workflow, SLM	⭐⭐

完整架构图

┌────────────────────────────────────────────┐
│ 【用户层】用户 ←→ 交互界面                   │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【Agent 层】AI Agent ←→ Orchestrator         │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【核心层】大语言模型 ←→ 记忆系统 ←→ Function Calling │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【工具层】Skills ←→ MCP Protocol ←→ Tools   │
└─────────────────┬──────────────────────────┘
                  │
┌─────────────────▼──────────────────────────┐
│ 【外部层】外部 API    数据库    文件系统     │
└────────────────────────────────────────────┘

术语分类表

类别	术语	重要性
核心概念	Agent, Skill, Tool, Function Calling, MCP, A2A	⭐⭐⭐
架构组件	Orchestrator, Memory, Context Window	⭐⭐⭐
关键技术	RAG, Prompt Engineering, Framework	⭐⭐⭐
新兴标准	MCP, A2A Protocol	⭐⭐
部署运行	Local LLM, Model Gateway, Skill Registry	⭐⭐
安全治理	Guardrails, Human-in-the-Loop	⭐⭐⭐
评估监控	Evaluation, Observability	⭐⭐
发展趋势	Multi-Agent, Agentic Workflow, SLM	⭐⭐

总结

AI Agent 生态正在快速发展，本文整理了 21 个核心术语：

学习阶段	术语
入门	Agent, Skill, Tool, Function Calling, Prompt
进阶	RAG, Memory, Orchestrator, Framework
高级	MCP, Multi-Agent, Guardrails, Observability

建议学习路径：

阶段 1: 基础概念 → 阶段 2: 动手实践 → 阶段 3: 架构设计
                                              │
阶段 5: 持续跟进 ← 阶段 4: 安全治理 ←──────────┘

推荐资源：

类型	资源
📚 文档	LangChain Docs, MCP Spec
🎥 视频	YouTube: LangChain, Anthropic
💻 实践	用 nanobot 创建自己的 Skill
📰 资讯	Hacker News AI, Twitter AI 社区

本文基于 2025-2026 年 AI Agent 生态整理，将持续更新。

GitHub: linychuo 博客: yongchao.li Telegram: @nanobot